#!/usr/bin/env python
# -*-coding:UTF-8 -*-
'''
@Project ：19-xpath站长素材.py
@File：45-selenium_药监局.py
@Author ：文非
@Date：2021/3/1615:26
@Require：# 网页自动化程序初始
'''

from selenium import webdriver
from lxml import etree
from time import sleep
# 实例化一个浏览器对象 传入浏览器的驱动程序
brows = webdriver.Chrome(executable_path="C:\Program Files\Google\Chrome\Application\chromedriver.exe")
# 编写基于浏览器自动化的操作代码

# 使用selenium 爬取动态加载的数据药监局 http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList
# 让浏览器发起一个指定url的对应请求

url = 'http://scxk.nmpa.gov.cn:81/xk/'
brows.get(url)
num=0
for page in range(1,380):
    # 获取浏览器当前页面源码数据
    page_text = brows.page_source  # page_source属性返回的是页面源码数据
    # print(page_text)
    tree = etree.HTML(page_text)
    li_list = tree.xpath('///ul[@id="gzlist"]/li')

    for li in li_list:
        name = li.xpath('./dl/@title')[0]
        print(name)
    num = num+1
    print('""""""""第""""'+str(num)+"""""数据""")
sleep(5)
brows.quit()